Google Gemini

Gemini
Generalized Multimodal Intelligence Network
Description de l'image Google Gemini logo.svg.

Informations
Créateur Google
Développé par Google Brain et DeepMind
Première version 7 décembre 2023[1]
État du projet officiellement lancé le 7 décembre 2023[1], et encore en développement
Type Famille de grands modèles de langage (d)Voir et modifier les données sur Wikidata
Licence Licence propriétaireVoir et modifier les données sur Wikidata
Site web deepmind.google/technologies/geminiVoir et modifier les données sur Wikidata

Google Gemini est une intelligence artificielle (IA), générative et multimodale, de type transformeur, créée par Google, annoncée lors de la conférence I/O destinée aux développeurs en juin 2023, puis présentée au public le 7 décembre 2023. Gemini signifie ici Generalized Multimodal Intelligence Network.

Ce grand modèle de langage (LLM) a été formé sur un ensemble massif de données de texte et d'images, entraîné sur les Tensor Processing Units (TPU) de Google. Il peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues). Il peut produire divers types de contenu créatif (images, dessins, sons, musique, vidéos...), aider des chercheurs en analysant des données ou en générant des hypothèses. Gemini peut répondre aux questions de manière informative ou en produisant des cours personnalisés, des jeux, des tutoriels..., avec les limites des IA (erreurs, biais, « hallucinations »...). Il a été conçu pour surpasser les capacités d'autres LLM, dont GPT-4, et permettre de nombreuses innovations. Selon les informations disponibles au début du 4e trimestre de 2023, Gemini doit améliorer les fonctionnalités d'autres produits de Google (Bard, mais aussi Google Docs et Google Slides, Google Translate, Google Photos, Google Assistant, Google Maps, You Tube ou Google Search), tout en étant relativement sobre en ressources.

Au moment de sa sortie (7 décembre 2023), ses principaux concurrents sont ChatGPT, DALL-E, MidJourney et Whisper d’OpenAI. Selon Semi-Analyse (une société de recherche sur les semi-conducteurs), Gemini pourrait être environ 5 fois plus puissant que ChatGPT (puis peut-être devenir jusqu'à 20 fois plus puissant fin 2024).

  • Gemini Nano, version allégée de Gemini est prévue pour tourner nativement et hors-ligne sur des smartphones Android en commençant par le Google Pixel 8 Pro et uniquement à partir de texte ;
  • Gemini Pro, le modèle moyen, remplacera LaMDA dans Bard pour les pays anglophones ;
  • Gemini Ultra, sera ensuite proposé aux Data Centers dans un premier temps, puis pour certaines applications d'entreprise (d'abord expérimentalement).

Selon Demis Hassabis, Gemini va peu à peu pouvoir se connecter à des éléments robotiques, être doté d'un sens du toucher et de capacités à agir sur des actionneurs, tout en devenant plus précis et plus conscient du contexte et du monde[1].

  1. a b et c Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées BigData12Dec2023

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy